Detección masiva de palabras clave con vocabulario abierto
Sistema detecta palabras clave con vocabulario abierto, reduce almacenamiento 128x, reconoce términos especializados sin reentrenar, en idiomas no vistos.
Sistema detecta palabras clave con vocabulario abierto, reduce almacenamiento 128x, reconoce términos especializados sin reentrenar, en idiomas no vistos.
Descubre LASA, un método de supervisión débil que segmenta bocetos con vocabulario abierto usando atención multi-capa. Mejora mIoU hasta +15.7. ¡Lee más!
Descubre cómo un pipeline de tres etapas con razonamiento multiprompt y metadatos logra identificar impactos en video sin entrenamiento previo. Mejora la precisión en vigilancia.
SCOUT permite que robots entiendan su entorno en tiempo real, combinando recorrido activo y gráficos de escenas 3D con incertidumbre. Aprende más.
GeoSAM-3D segmenta objetos en 3D desde un video monocular con un clic. Usa propagación geodésica sobre Gaussian Splatting para precisión en superficies curvas. ¡Descúbrelo!